热门问题
时间线
聊天
视角
基本拉丁字母 (Unicode区段)
来自维基百科,自由的百科全书
Remove ads
基本拉丁字母(Basic Latin),又称C0控制字符及基本拉丁字母(C0 Controls and Basic Latin),是Unicode标准下的首个Unicode区段,亦是唯一一个在UTF-8下,以单一字节编码的区段。此区段包含ASCII编码下所有字母与控制字符。该区段的范围为U+0000..U+007F(共128个字元),包含C0控制字符、ASCII标点符号与规约符号、ASCII数字、英文字母中的大写与小写字母,以及一个控制字元。
基本拉丁字母区段内的字元Unicode标准的1.0版本起一直沿用至今,多年来未曾对此作出任何增减。[3]该区段在1.0版本的名称为ASCII。[4]
Remove ads
字符表
下表列出基本拉丁字母包含的所有字符[5]:
Remove ads
子标题
“C0控制字符及基本拉丁字母”区段内包含六个子标题。[5]
“C0控制字符”(C0 Controls,于1.0版本中称为C0 ASCII控制符)乃继承自ASCII及其他7位元及8位元编码系统。C0控制字符的别名乃基于ISO/IEC 6429:1992标准而取。[5]
“ASCII数字”(ASCII Digits)子标题包含标准欧式数字字元1-9及0。[5]
“大写拉丁字母”(Uppercase Latin alphabet)子标题包含26个标准、无附加符号的大写拉丁字母。[5]
“小写拉丁字母”(Lowercase Latin alphabet)子标题包含26个标准、无附加符号的小写拉丁字母。[5]
“控制字元”(Control Character)子标题仅包含“删除”字元。[5]
符号、字母与控制符数量
下表列出C0控制字符及基本拉丁字母区段中,各子标题的字母、符号与控制符数量。
区块
C0控制字符和基本拉丁字母 C0 Controls and Basic Latin[a] Unicode Consortium 官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+005x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+007x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
|
Remove ads
变体
部份字元若跟从变体指示器(variant indicators),则会以标准化变体的定义生成。
区段内亦有一个为字元“0”定义、带有短对角斜线的变体0︀(U+0030 DIGIT ZERO U+FE00 VS1)。[7][8]
12个字元可透过U+FE0E VS15或U+FE0F VS16以生成绘文字变体。[9][10][11][12]它们均为键帽基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是“文字样式”,而VS16版本则为“绘文字样式”。[8]
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
基本码位 | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
基本+VS15+键帽 | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
基本+VS16+键帽 | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Remove ads
历史
以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程:
参见
注释
参考资料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads